Fast R-CNN 是一种用于目标检测的深度学习方法(算法/框架),通过在整张图像上共享卷积特征、再对候选区域(region proposals)做 RoI(Region of Interest)特征提取,从而比早期的 R-CNN 更快、更高效地完成“找出图像里有什么物体、它们在哪里”的任务。(除检测外,它也常被作为理解两阶段检测器发展的关键节点;该术语也可能被泛化用于指代该系列方法。)
/fæst ˌɑːr siː ɛn ɛn/
Fast R-CNN can detect cars in street photos.
Fast R-CNN 可以在街景照片中检测到汽车。
Compared with R-CNN, Fast R-CNN speeds up training by sharing convolutional features and using RoI pooling for each proposal.
与 R-CNN 相比,Fast R-CNN 通过共享卷积特征并对每个候选区域使用 RoI pooling 来加速训练。
“Fast” 表示“更快的”。“R-CNN”是 Regions with CNN features 的缩写,意为“用卷积神经网络(CNN)的特征来表示候选区域(Regions)”。Fast R-CNN 由 Ross Girshick 提出,核心改进在于:不再对每个候选框单独跑一遍 CNN,而是先对整张图计算特征图,再对不同区域进行特征汇聚与分类/回归,从而显著提升效率。